VideoRefer套件:阿里让视频AI真正“看懂”复杂场景中的每个物体
这项由阿里巴巴达摩院和浙江大学联合开展的研究发表于2025年3月25日的arXiv预印本平台,有兴趣深入了解的读者可以通过论文编号arXiv:2501.00599v3访问完整论文。这项研究的主要作者包括浙江大学的袁宇倩、李文桐、张文桥、朱剑科等,以及达摩院的张
视频 套件 videorefer videorefer套件 2025-09-16 22:30 3
这项由阿里巴巴达摩院和浙江大学联合开展的研究发表于2025年3月25日的arXiv预印本平台,有兴趣深入了解的读者可以通过论文编号arXiv:2501.00599v3访问完整论文。这项研究的主要作者包括浙江大学的袁宇倩、李文桐、张文桥、朱剑科等,以及达摩院的张
视频 套件 videorefer videorefer套件 2025-09-16 22:30 3
这套系统的革命性在于,它不仅能理解视频的整体内容,更能精确识别和追踪视频中的任何特定物体,并且能够跨时间理解这些物体之间的复杂关系。这就好比从只能看懂电影剧情大纲,升级到能够详细分析每个角色在每个时刻的行为和互动关系。
视频 套件 videorefer videorefer套件 2025-09-16 21:23 6